31 research outputs found
A magyar beszĂ©dben elĹ‘fordulĂł mássalhangzĂł-kapcsolĂłdások rezgĂ©skĂ©pĂ©nek Ă©s akusztikai szerkezetĂ©nek kutatása, rendszerezett leĂrása = Research of the acoustic structure of Hungarian consonant clusters in speech
A magyar hangtani kutatásokbĂłl hiányzik a mássalhangzĂł kapcsolĂłdások akusztikai szerkezetĂ©nek bemutatása. A kutatással elĂ©rni kĂvánt cĂ©l: ismerjĂĽk meg a mássalhangzĂł kapcsolĂłdások akusztikai szerkezetĂ©t, tudjuk meg, hogy mely akusztikai paramĂ©terek a legfontosabbak a mássalhangzĂł kapcsolĂłdásokban a folyamatos beszĂ©d korrekt felĂ©pĂtĂ©se szempontjábĂłl. Az akusztikai jelbĹ‘l visszakövetkeztethetĂĽnk az artikuláciĂłra. Itt arra vagyunk kĂváncsiak, hogy milyenek a mozgássorozati elemek a mássalhangzĂł kapcsolĂłdásban, mely mozgáselemek egyszerűsödnek, illetve melyek nem változnak a mássalhangzĂł hagyományos, pĂ©ldául intervokális helyzetű kĂ©pzĂ©sĂ©hez viszonyĂtva. A vizsgálatokat kĂ©t-, három-, nĂ©gy- Ă©s ötelemű mássalhangzĂł kapcsolatokra vĂ©geztĂĽk. A várhatĂł eredmĂ©ny: összefoglalĂł leĂrás a magyar mássalhangzĂł kapcsolĂłdások akusztikai szerkezetĂ©rĹ‘l. Az eredmĂ©nyeket oktatási anyag formájában az Interneten is hozzáfĂ©rhetĹ‘vĂ© tesszĂĽk. | There are no data about the acoustic structure of consonant clusters in Hungarian speech. The aim of this research is to get more knowledge about the acoustic specialities of these speech building elements and to determine the invariant acoustic parameters. It is also possible to derive the articulation movements from the acoustic parameters, so the articulation of these consonant clusters can be studied as well. The following clusters are investigated: CC, CCC, CCCC, CCCCC. The result is a study about the Hungarian consonant clusters in speech. The book is to be published in Hungarian in 2007. Besides this the results can be studied ont he Internet at the home page: http://fonetika.nytud.hu/cccc . This interactive speech database serves as a good tool for education and research as well
Predicting Hungarian sound durations for continuous speech
Direct measurements show that a number of factors influence the final value of sound durations in continuous speech. On the segmental level it is mainly the articulatory movements that determine important influence factors, while on the suprasegmental level accent, syllabic stress, within-word position, the preceding and following syllables and finallyutterance position may have an influence on final sound durations. So the problem of how to predict sound durations can be described with a multivariable function in which the effect of the variables cannot be easily defined with good accuracy. It is difficult to separate the effects of certain functions, i.e., it is difficult to model this function, making direct measurements on the speech signal. A model has been constructed and realized in which three well-defined levels are working separately. In the first one (this is the segmental level) the separation of the effect of articulation from other factors is solved. The second and third levels relate to the suprasegmental level of speech
The most important prosodic patterns of Hungarian
Prosody is a general term for the following features in speech: pitch and intonation, stress, articulation rate, sound intensity and time structure (rhythm and pauses). During verbal communication various prosodic forms contribute to the expression of the content of the message (the information carried by the text, emotional expression, to imitate a situation etc.). So, prosody can be represented as a multivariable function in which the number of variables is rather high. Therefore it is difficult to describe the complex process for all situations, meanings, and emotions. In this paper we try to give a phonetic level characterization of pitch and intonation structure and also the function of intensity in time of the main Hungarian sentence types (using a unified description). The manner of description is new concerning Hungarian. It is based on a unified relative scale in which not physical values but relative distances in pitch values and intensity are used to characterize the melody forms and the intensity levels. This description allows for the representation of these two prosodic elements independently of the personal features (mean F0 value, the range of the F0 of the speaker, etc.). The representation makes it possible to express the crossfunctions among the melody forms of different expressions. This means that complete prosodic patterns can be predicted for any text without an acoustic analysis
Fonetikai algoritmus a hanghatárok gĂ©pi meghatározásának javĂtására nagymĂ©retű beszĂ©dadatbázisokban
A beszĂ©dtechnolĂłgiai kutatásokhoz Ă©s gyakorlati alkalmazásokhoz egyre nagyobb mĂ©retű beszĂ©dadatbázisokat terveznek. Ezek egyik fajtája, amikor elĹ‘re meghatározott szöveg felolvasásával hozzák lĂ©tre a több Ăłrányi beszĂ©danyagot. Ilyen adatbázis pĂ©ldául a BME TMIT idĹ‘járás jelentĂ©seket tartalmazĂł beszĂ©dkorpusza, amelyik 5400 mondatot tartalmaz. Ahhoz, hogy gĂ©pi mĂłdszerekkel lehessen ezt a hanganyagot a kĂ©sĹ‘bbiekben feldolgozni (szavakat, hangkapcsolatokat keresni stb.), a szöveget át kell Ărni hangszintű szimbĂłlumsorozattá, majd jelölni kell a hanghullámon a hangokat, azok határát, a szavak kezdetĂ©t, a szĂĽneteket, valamint szinkronba kell hozni a szöveget a hangzĂł formával automatikus gĂ©pi felismerĂ©s segĂtĂ©sĂ©gĂ©vel. Az Ăgy jelölt hangok Ă©s hanghatárok csak mintegy 95%-os pontossággal adnak kellĹ‘en helyes eredmĂ©nyt. Ez azonban nem elegendĹ‘ a jĂł minĹ‘sĂ©gű, korpusz alapĂş beszĂ©dszintĂ©zishez. Ebben a tanulmányban egy olyan utĂłfeldolgozĂł algoritmust ismertetĂĽnk, amelyikkel növelni lehet a pontosságot, ezzel a szintĂ©zis minĹ‘sĂ©gĂ©t
InteraktĂv formánsĂ©rtĂ©k-mĂłdosĂtĂł fejlesztĂ©se
A cikkben bemutatjuk egy webalapĂş interaktĂv formánsĂ©rtĂ©kmĂłdosĂtĂł program felĂ©pĂtĂ©sĂ©t Ă©s használatát. Az alkalmazás kötött szerkezetben várja a kiindulĂł formánsĂ©rtĂ©keket, melyeket egy Flash-ben kĂ©szĂĽlt program segĂtsĂ©gĂ©vel tudunk kĂ©nyelmesen mĂłdosĂtani, azaz hozzáigazĂtani a hangszĂnkĂ©phez. A kiindulási Ă©s mĂłdosĂtott Ă©rtĂ©keket is MySQL adatbázisban tároljuk, melyek fel- Ă©s letöltĂ©srl kĂĽlön funkciĂł gondoskodik. A formánsmĂłdosĂtás során használt hangszĂnkĂ©p megjelenĂtĂ©sĂ©hez a WAV formátumĂş hangfájlok feltöltĂ©se is szĂĽksĂ©ges. A fejlesztĂ©st a magyar formánsadatbázis kĂ©szĂtĂ©se Ă©s továbbfejlesztĂ©se ihlette
Magyar hangsúly-adatbázis az interneten kutatáshoz és oktatáshoz
HangsĂşlyadatbázis eddig nem kĂ©szĂĽlt magyar nyelvre. BeszĂ©dtechnolĂłgiai kutatásokban Ă©s az oktatásban is nagy igĂ©ny lenne egy referenciakĂ©nt használhatĂł, helyes hangsĂşlycĂmkĂ©ket tartalmazĂł mondatgyjtemĂ©nyre. FejlesztĂ©sĂĽnkkel ezt a hiányt kĂvántuk pĂłtolni. A webes lekĂ©rdezfelĂĽlettel rendelkez hangsĂşlyadatbázisunk 1869 kijelent mondatot tartalmaz, amelyekben minden szĂł hangsĂşlypozĂciĂłját megjelöltĂĽk. A honlapon számos szempont alapján kereshetĂĽnk Ă©s a találati lista is több formában (szöveges, kĂ©p Ă©s hang) jelenĂthet meg. A vizsgált magyar mondatok hangsĂşlymintázatainak gyakorisága is lekĂ©rdezhet. A honlap a http://magyarbeszed.tmit.bme.hu/hangsuly cĂmen Ă©rhet el
KĂsĂ©rlet automatizált szövegelemzĂ©si mĂłdszerek kialakĂtására a szĂłhangsĂşlyok meghatározásához
Az automatikus szövegelemzĂ©s bonyolult kĂ©rdĂ©skörĂ©bĹ‘l egy rĂ©sztĂ©ma vizsgálatát tztĂĽk ki cĂ©lul, nevezetesen a hangsĂşly-kategĂłriák szavankĂ©nti kijelölĂ©sĂ©t meghatározott mondatokban. Az eredmĂ©nyeket a gĂ©pi beszĂ©dszintĂ©zis prozĂłdiai támogatáshoz tervezzĂĽk felhasználni. A hangsĂşly-kategĂłriákat Ăşgynevezett cĂmkĂ©kkel jelöljĂĽk a szĂł elĹ‘tt a szövegben. A cĂ©lkitűzĂ©st kĂ©t iránybĂłl közelĂtjĂĽk: A klasszikus mĂłdszernĂ©l a cĂmkĂ©ket nyelvĂ©szeti mondatelemzĂ©s eredmĂ©nyĂ©bĹ‘l nyerjĂĽk. A másik eljárás lĂ©nyege nem nyelvĂ©szeti központĂş, hanem egyfajta egyszer felszĂni szövegelemzĂ©s, melyben nem használunk nyelvĂ©szeti mĂłdszereket, csupán szĂłlistákat, táblázatokat, egyszer szabályokat. MindkĂ©t elemzĂ©si formánál alapkövetelmĂ©ny az algoritmizálhatĂłság. Az elemzĂ©sekhez ugyanazokat a hangsĂşly-kategĂłriákat használjuk, Ăgy mĂłd nyĂlik arra, hogy közvetlenĂĽl összehasonlĂthassuk a nyelvĂ©szeti elemzĂ©s eredmĂ©nyĂ©t a nem nyelvĂ©szeti központĂş eljárásbĂłl kapott hangsĂşly jelölĂ©sekkel. RávilágĂtunk mindkĂ©t elemzĂ©snĂ©l, hogy mely problĂ©mák miatt nem kaphatunk teljes Ă©rtĂ©k eredmĂ©nyt sok esetben
REALIS 1.1
A laptopos bemutatásra szánt eALIS1.1 program elssorban nyelvĂ©szek (mint „bels felhasználĂłk”) számára hivatott eszköztárat adni olyan nyelvfragmentumok Ă©pĂtĂ©sĂ©re, amelyek jĂłl ragadják meg a termĂ©szetes nyelvek sajátosságait, elssorban a kompozicionális jelentĂ©sösszegzdĂ©st. A definiálhatĂł jelentĂ©sek olyan pragmatikai-szemantikai leĂrások, amelyek megfelelnek a (reprezentacionalista dinamikus diskurzusszemantikák családjába tartozĂł) eALIS releváns definĂciĂłinak. A felĂ©pĂtett nyelvet alkalmazĂłkat kĂĽls felhasználĂłkĂ©nt határozhatjuk meg. LĂ©nyegĂ©ben egy sajátosan megsokszorozott adatbázist kapnak, ami a valĂł világ modellje mellett annak alternatĂváit is felkĂnálja. A eALIS alapállása szerint ezek a formális szemantikábĂłl ismerhet „lehetsĂ©ges világok” mindig odaköthetek a világmodellben jelen lĂ©v humán ágensekhez mint azok (tĂ©v-) hiedelmei, vágyai, szándĂ©kai, álmai. A kĂĽls felhasználĂł a program használata során (lĂ©pĂ©srl lĂ©pĂ©sre) lexikai egysĂ©geket kap választásra, ezekbl mondatokat Ă©pĂthet, a felĂ©pĂtett mondatoknak pedig megkapja az igazságĂ©rtĂ©kelĂ©sĂ©t egy általa kiválasztott vagy feltöltött világmodell alapján. Az igazságĂ©rtĂ©kelĂ©st olyan „konstruktivista” mĂłdon kib- vĂtve Ă©rtjĂĽk, hogy a program az „igaz” válaszon tĂşl megadja mindazt az informáciĂłt, ami alátámasztja e választ. Nemcsak a nyelvleĂrás „prĂłbára tĂ©telĂ©t” szolgálhatja tehát a program, hanem adatgyjtĂ©sre Ă©s -rendszerezĂ©sre is használhatĂł